Contents
前言
章節名稱: types of learning
特別提醒一下,這個章節的很多名詞都可以去 Google 或 維基百科,可以得到更多有用的資訊!
機器學習 右側。
一 Learning with Different Output Space
從機器輸出 $y$ 的類型來說明不同種的問題。
一些問題分類
Binary Classification (二元分類): 也就是是非題
Multiclass Classification (多元分類): 可以看成選擇題,輸出可能有 K 種(二元分類 K = 2),例如:郵件分類、辨別圖片上的水果、銅板分類。
Regression (迴歸分析): 其輸出為實數空間,或某個實數範圍(bounded regression),例如:股票價格預測、天氣預測。
Structured Learning (Structured prediction): 舉例來說,將給定的句子當作輸入,分析每個詞的詞性,而因為所在位置或語意的不同,同樣的詞可能會有不同詞性。可把它看成一個很大的多元分類,底下的類別有某種結構上的關係。
還有例如:蛋白質的分析,其構造哪邊彎哪邊折會有不同影響。
二 Learning with Different Data Label
從 Data 中的 $x_n$ 有沒有相對應的 $y_n$ ,來區別不同的學習。
一些學習方法
Supervised Learning (監督式學習): 資料中,對於給定的輸入 ($x_n$),有給予相對應的輸出 ($y_n$)。
是一個機器學習中的方法,可以由訓練資料中學到或建立一個模式(函數 / learning model),並依此模式推測新的實例。訓練資料是由輸入物件(通常是向量)和預期輸出所組成。 - 維基百科
Unsupervised Learning (非監督式學習): 資料中不給予其類別,不曉得哪一個輸入是屬於哪一個類別。Cluster 是一個常見的 Unsupervised Learning。
維基百科
Unsupervised Learning 資料中沒有 $y_n$ ,我們想要學到淺藏在下的 $y_n$ ,例如其機率函數,
以下是一些 Unsupervised Learning 的例子:
Clustering: 簡而言之的話就是分群
Density estimation: 想要知道輸入的這些點在哪些地方是比較稠密的,又或是比較稀疏的。
Outlier detection: 找出資料中有某些地方怪怪的,有點像是極值或異常值的概念。例如:流量異常。
相較之下 監督式學習 有較固定的標記與目標, 非監督式學習 的目標則比較分散,也就較難衡量其演算法的好壞。
而介於這兩者之中的是 :
- Semi-supervised(半監督式學習) : 少部分已分好的標籤($y_n$)加上還沒有分類好的,兩者混再一起來做學習。對於替資料標記,可能需要很高的成本,對此我們可能就會替部分資料標記,來使用 半監督式學習。
可以看一下此投影片的三個統計圖:
Reinforcement Learning
這邊舉了小狗的例子,當我們對它命令 坐下 ($x_n$) ,牠不一定會乖乖聽話,說不定會有別的行為 ($y_n$),此時我們做的反應則是依據小狗的回應來給予相應的 懲罰(不好) 或 獎勵(好)。(不一定非坐下就給予懲罰)
這種方法稱作: Reinforcement Learning 強化學習 or 增強式學習。
這邊舉了兩個例子:
廣告系統: 顧客是 輸入,廣告系統產生出的廣告位置是 輸出,而顧客是否點擊或讓你賺到錢則是放這個廣告的 好或不好。
玩牌: 手上的牌是 輸入,我們出的策略是 輸出,而最後賺到的錢或輸贏則是這個策略的 好或不好 。
與前面學習方法的差別,大致上是 我們靠的並不是 很直接 的輸出資訊,而是另外一個輸出和其好壞來進行學習的動作。而通常這種學習的動作會 序列 的發生,也就是一筆一筆的進行。
不一定是完全正確、最期待的輸出,我們或許還是會給予獎勵。
總結
我們總共提了4種不同的學習方式,而這些的核心是 Supervised Learning。